3 research outputs found

    Mining and Managing User-Generated Content and Preferences

    Get PDF
    Ιn this thesis, we present techniques to manage the results of expressive queries, such as skyline, and mine online content that has been generated by users. Given the numerous scenarios and applications where content mining can be applied, we focus, in particular, to two cases: review mining and social media analysis. More specifically, we focus on preference queries, where users can query a set of items, each associated with an attribute set. For each of the attributes, users can specify their preference on whether to minimize or maximize it, e.g., "minimize price", "maximize performance", etc. Such queries are also know as "pareto optimal", or "skyline queries". A drawback of this query type is that the result may become too large for the user to inspect manually. We propose an approach that addresses this issue, by selecting a set of diverse skyline results. We provide a formal definition of skyline diversification and present efficient techniques to return such a set of points. The result can then be ranked according to established quality criteria. We also propose an alternative scheme for ranking skyline results, following an information retrieval approach

    Εξόρυξη και διαχείριση περιεχομένου παραγόμενο από χρήστες και προτιμήσεων

    No full text
    The World Wide Web is evolving, as new technologies constantly emerge. Capturing the users’ preferences is essential to provide them with engaging services that better fulfill their needs. For this reason, this thesis proposes distinct ways to consider user preferences, either in pre-usage or post-usage scenarios. Skyline queries are a characteristic example where the user may specify her preferences in a pre-usage scenario. A problem of skyline queries is that the result size may be too large. To counter this problem, we propose techniques to diversify the result of a skyline query. Diversifying the skyline is mapped to an NP-Hard problem (k-dispersion). Therefore we propose efficient approximations to solve it. As a post-usage scenario, users are able to provide feedback through online reviews. These reviews describe the experience of a user with a product / service, and what aspects / features of the product they liked or did not like. Using this information, we present techniques to identify competitive products. Competitive products are those that can cover similar needs of similar groups of people. We performed an extensive evaluation of our methodology and demonstrated that our model is able to efficiently and effectively capture the competitiveness of items. Finally, user preferences and interests may be captured through information posted online, in social media platforms. Social media data can be used to identify events that occur in the physical world. Unfortunately, given the particularities of social media, straightforward solutions (namely online clustering) do not perform well. To address this problem, we resorted to affective theories of emotion from psychology, according to which external stimuli (i.e. events) have an effect on a person’s emotional state and compel them to externalize their thoughts. Using these theories as our starting point, we monitored the aggregate emotional state of large groups of people, geographically dispersed, and automatically identified abrupt changes. The assumption is that abrupt changes in the aggregate emotional state of the group is due to external stimuli. To achieve this, we developed custom geocoding techniques that convert text to GPS coordinates, a classification framework mapping social media data to emotions, an online outlier detection algorithm that operates on the probability density function of the aggregate emotional state, and a visualization technique to ease the presentation of events.Ο παγκόσμιος ιστός εξελίσσεται διαρκώς, καθώς νέες τεχνολογίες έρχονται στο προσκήνιο. Για την καλύτερη εξυπηρέτηση των αναγκών των χρηστών είναι σημαντικό να λαμβάνουμε υπόψη τις προτιμήσεις τους. Για το λόγο αυτό, στην παρούσα διατριβή προτείνουμε διαφορετικούς τρόπους για να λαμβάνονται υπόψη οι προτιμήσεις των χρηστών, είτε σε περιπτώσεις προ-χρήσης ή μετά-χρήσης (ενός προϊόντος). Τα ερωτήματα κορυφογραμμής είναι ένα χαρακτηριστικό παράδειγμα όπου ο χρήστης μπορεί να δηλώσει τις προτιμήσεις του προ-χρήσης. Το πρόβλημα αυτών των ερωτημάτων είναι ότι το μέγεθος του αποτελέσματος μπορεί να είναι πολύ μεγάλο. Για την αντιμετώπιση αυτού του προβλήματος, προτείναμε τεχνικές για την διαφοροποίηση του αποτελέσματος ενός ερωτήματος κορυφογραμμής. Η διαφοροποίηση της κορυφογραμμής απεικονίζεται σε ένα NP-Hard πρόβλημα. Συνεπώς, προτείνουμε αποδοτικές προσεγγιστικές τεχνικές για την επίλυσή τους. Ως σενάριο μετά-χρήσης, οι χρήστες μπορούν να δώσουν την ανατροφοδότησή τους μέσω διαδικτυακών κριτικών. Οι κριτικές περιγράφουν την εμπειρία του χρήστη με το προϊόν / υπηρεσία και ποια χαρακτηριστικά του προϊόντος τους άρεσαν (ή όχι). Χρησιμοποιώντας αυτή την πληροφορία, προτείνουμε τεχνικές για την εύρεση ανταγωνιστικών προϊόντων. Τα ανταγωνιστικά προϊόντα είναι εκείνα τα οποία μπορούν να καλύψουν παρόμοιες ανάγκες από παρόμοιες ομάδες χρηστών. Πραγματοποιήσαμε μια εκτενή αξιολόγηση της μεθοδολογίας μας και δείξαμε ότι το μοντέλο μας μπορεί να συλλάβει αποδοτικά την ανταγωνστικότητα μεταξύ προϊόντων. Τέλος, μπορούμε να συλλάβουμε τις προτιμήσεις χρηστών και των ενδιαφερόντων τους μέσω πληροφοριών που υπάρχουν στο διαδίκτυο, σε πλατφόρμες κοινωνικών μέσων. Τα δεδομένα από κοινωνικά μέσα μπορούν να χρησιμοποιηθούν για την αναγνώριση συμβάντων που προκύπτουν στον φυσικό κόσμο. Δυστυχώς, δεδομένων των ιδιαιτεροτήτων των κοινωνικών μέσων, οι απλές τεχνικές δεν αποδίδουν καλά. Για την αντιμετώπιση αυτού του προβλήματος, καταφεύγουμε σε θεωρίες συναισθημάτων από την ψυχολογία, σύμφωνα με τις οποίες τα εξωτερικά ερεθίσματα (δλδ., γεγονότα) επηρεάζουν την συναισθηματική κατάσταση ενός ατόμου και τους ωθούν να εξωτερικεύσουν τις σκέψεις τους. Αξιοποιώντας αυτές τις θεωρίες ως σημείο έναρξης, παρακολουθούμε την συλλογική συναισθηματική κατάσταση μεγάλων ομάδων ατόμων, γεωγραφικά διασκορπισμένων, και αναγνωρίζουμε απότομες μεταβολές με αυτοματοποιημένες διαδικασίες. Η υπόθεση μας είναι ότι οι απότομες μεταβολές στην συναισθηματική κατάσταση της ομάδας οφείλονται σε εξωτερικά ερεθίσματα. Για να επιτύχουμε αυτό το στόχο, αναπτύξαμε τεχνικές γεωπληροφόρησης που μετατρέπουν κείμενο σε συντεταγμένες GPS, ένα πλαίσιο κατηγοριοποίησης δεδομένων από κοινωνικά μέσα σε συναισθήματα, ένα επιγραμμικό αλγόριθμο αναγνώρισης ακραίων τιμών ο οποίος λειτουργεί με την συνάρτηση πυκνότητας πιθανότητας των συλλογικής συναισθηματικής κατάστασης, και μία τεχνική οπτικοποίησης για την διευκόλυνση της παρουσίασης των γεγονότων που αναγνωρίσαμε

    Skylines and Other Dominance-Based Queries

    No full text
    corecore